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摘要 业务 流程 作为 一 种 支持 业务 协同 的 有 效 方式 , 在 企业 
l 据 。 但 建设 业务 流程 系统 往往 


要 的 作用 ， 使 决策 层 能 实时 掌握 经 营 数 


入 不 菲 的 成 本 。 本 文 针 对 当前 中 小 企业 在 建设 业务 流程 管理 系统 中 存在 的 “需求 "与 
提出 了 一 种 支持 多 租户 的 Saas 业务 流程 系统 
用 托管 和 运行 环境 ， 为 中 小 企业 提供 一 


VINCA ProFlow， 强 调 利 


内 部 精细 化 管理 、 上 下 游 合作 伙伴 整合 中 起 着 重 
需要 在 软 硬 人 


采购 、 人 员 配 备 方面 投 
投入 能 力 ” 之 间 的 矛盾 ， 


j 云 基础 设施 的 能 力 提供 流程 应 


种 可 按 需 租用 的 流程 服务 (BPM-as-a-Service)。 各 个 租户 在 共享 同 


一 流程 服务 实例 的 同时 ， 又 可 专 享 独立 


的 数据 空间 ， 保 证 了 租户 间 数 据 的 有 效 隔离 和 隐私 保护 。 文 中 有 针 


对 性 地 讨论 了 VINCA ProFlow 的 研发 动机 、 关 键 问题 以 及 求解 方法 。 


关键 词 云 计算 软件 即 服务 多 租户 业 


1 引言 


务 流程 软件 服务 


流程 管理 技术 可 以 为 集成 型 应 用 提供 文 撑 环 境 ， 帮 助 企 业 、 单 位 对 业务 流程 获得 可 见 性 


并 实施 控制 ， 广泛 应 用 于 办 公 、 物 流 、 科 学 计算 、 应 急 联 动 
件 和 流程 管理 软件 的 采购 成 本 以 及 相应 技术 人 员 的 人 力 成 
的 中 小 企业 对 之 望而却步 。 另 一 方面 ， 有 些 企 事 业 单 位 


件 系统 的 实施 成 本 (包括 服务 器 便 


本 ) 居 高 不 下 ， 使 得 众多 正在 创业 期 


等 领域 。1 


于 传统 流程 管理 软 


对 流程 管理 的 需求 可 能 突然 发 生 在 


低 了 应 对 突 发 事件 (如 抗震 救灾 ) 


为 了 降低 企业 使 用 流程 系统 的 成 本 ， 在 行业 云 资源 9 


的 能 


某 一 个 特定 时 期 内 , 需求 的 临时 性 与 高 投入 使 其 不 愿意 投 
入 流程 应 用 的 建设 ， 宁 可 靠 人 工 执 行 流程 ， 造 成 多 个 相关 组 织 机 构 间 数据 延迟 和 不 一 致 ， 降 


FP 人 心 VINCA TARC 中 提供 业务 流程 


服务 能 力 成 为 一 个 关键 问题 。 为 此 ， 基 于 云 计算 技术 ”和 SaaS' 模 式 ， 本 文 提出 了 一 种 支持 


多 租户 的 SaaS 流程 系统 


拥有 成 本 。 


2 ”相关 工作 


VINCA ProFlow, 
服务 (BPM2 as a Service)。 基 于 SaaS 模式 ， 运 营 商 
运营 以 及 升级 维护 等 成 本 ,利用 规模 效应 降低 软件 的 运营 成 本 ， 从 而 降低 了 每 个 客户 的 总 体 


可 以 集 


目标 是 提供 云 计算 环境 中 可 按 需 租用 的 流程 
控制 IT 基础 设施 、 软 件 系统 、 


随 着 云 计 算 的 兴起 ， 基 于 云 计 算 环 境 的 Saas 流程 系统 也 开始 出 现 。 


流程 系统 的 现状 进行 简要 说 明 ， 然 后 介绍 相关 关键 技术 的 


2.1 Saas 流程 系统 
云 计 算是 一 种 建立 在 抽象 的 、 


而 SaaS 交付 模型 各 种 云 计 算 使 用 模式 中 的 一 种 ,SaaS 应 用 部 署 并 运营 在 供应 商 的 数据 ， 


究 进 展 。 


本 节 将 首先 对 SaaS 


可 共享 和 具有 弹性 的 资源 之 上 的 开 服务 消费 和 交付 方式 ， 


\ 
bb, 


并 允许 多 个 终端 用 户 远程 访问 同一 个 应 用 实例 。SaaS 交付 模式 的 一 个 特点 是 其 租赁 模型 ， 


1 Software as a Service， 软 件 即 服务 〈 或 软件 作为 服务 ) 


”Business process management， 业 务 流 程 管理 
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目前 SaaS 供应 商 采 用 的 租赁 模型 大 致 可 归纳 为 如 下 三 种 。 
表 1. 三 种 不 同 的 租赁 模型 

租赁 模型 描 述 优 缺 点 
不 同 租户 拥有 不 同 的 应 用 实例 , 每 个 实 | 数据 独立 性 好 , 但 需要 供应 商 提 
例 对 应 特定 的 数据 源 ; 供 更 多 服务 器 空间 ， 成 本 较 高 
所 有 租户 共享 同一 应 用 实例 , 所 有 租户 | 对 运营 商 和 租户 而 言 成 本 都 较 
的 数据 保存 在 相同 的 数据 库 中 , 通过 风 | 低 ， 但 牺牲 了 数据 的 隔离 性 
辑 方 式 进行 数据 隔离 ; 
所 有 租户 共享 同一 应 用 实例 , 每 个 租户 | 成 本 介 于 单独 租赁 和 全 共享 租 
数据 独 享 租赁 | 独 享 数据 空间 , 实现 了 租户 间 数 据 的 物 | 赁 之 间 ， 但 保证 了 数据 隔离 性 
理 隔离 。 


目前 VINCA ProFlow 的 SaaS 租赁 模型 采取 的 是 数据 独 享 、 应 用 实例 共享 的 模式 。 除 非 
SaaS 供应 商 公 开 说 明 ， 不 然 从 外 部 很 难 区 分 全 共享 租赁 和 数据 独 享 租赁 。 


伴随 着 云 计算 的 兴起 ， 基 于 云 计算 环境 的 工作 流产 品 也 开始 出 现 。 例 如 ，IBM 的 BPM 
BlueWorks 趾 ， 富 士 通 的 Cloud BPM, TIBICO 的 Spotfire 等 。IBM BPM BlueWorks 提供 了 
一 系列 基于 云 计 算 的 业务 流程 管理 服务 ， 借 助 BPM BlueWorks， 企 业 领 导 者 、 企 业 分 析 师 
和 企业 专业 人 员 将 可 以 通过 浏览 器 进行 内 容 创 建 、 共 享 和 协作 ,充分 利用 预 置 的 流程 模板 和 
来 自流 程 管理 专家 以 及 全 球 用 户 的 贡献 , 快速 完成 从 制定 战略 到 执行 流程 的 全 部 工作 。 富士 
通 的 Cloud BPM 提供 了 多 租户 支持 ， 并 且 可 以 根据 租户 的 需求 对 工作 流 的 功能 进行 裁剪 。 
TIBICO 的 Spotfire 除了 提供 基本 的 流程 管理 服务 外 ， 还 具备 业务 活动 监控 和 关键 数据 分 析 
的 功能 。 


除了 工业 界 推出 的 这 些 云 工作 流产 品 , 学 术 界 也 开始 越 来 越 多 地 关注 基于 云 计算 环境 的 
工作 流 中 存在 的 研究 问题 。 这 其 中 既 有 利用 云 计算 的 基础 设施 来 改善 原 有 工作 流 引 擎 性 能 的 
研究 , 也 有 探索 在 云 计 算 环境 中 如 何 设计 工作 流 架 构 方面 的 研究 ,美国 印第安 纳 大 学 霍 法 CC. 
Hoffa) 等 人 探索 了 科学 工作 流 Pegasus-WMS 在 本 地 集群 和 云 计 算 虚 拟 集 群 中 的 性 能 对 
比 中 。 德 国 马尔 堡 大 学 的 德 纳 曼 〈(T Dirnemann ) 等 人 开发 了 一 款 BPEL3 引 擎 插件 9， 可 
以 将 BPEL 流程 中 的 某 些 计算 密集 型 活动 动态 调度 到 Amazon EC2 的 云 节点 中 。 加 拿 大 多 伦 
多 大 学 的 穆 都 萨 米 〈V Muthusamy) 等 人 探讨 了 云 工作 流 的 架构 挑战 ， 并 提出 了 一 种 基于 事件 
的 、 服 务 等 级 协议 (SLA，Service Level Agreement) 驱动 的 架构 加， 将 流程 动态 分 解 成 有 发 
布 /订阅 (Pub/Sub) 关 系 的 多 个 活动 ， 以 适应 云 计算 的 分 布 环境 。 可 见 ， 基 于 云 计 算 环 境 的 工 
作 流 正 逐 渐 成 为 工作 流 领域 人 们 关注 的 焦点 。 


尽管 工业 界 和 学 术 界 已 经 开展 了 诸多 实践 和 研究 工作 ， 但 对 于 如 何 定 义 SaaS 流程 系统 
还 未 形成 定论 。 这 是 因为 流程 系统 本 身 包 含 了 流程 发 现 、 建 模 、 念 真 测试 、 规 则 、 监 控 以 及 
工作 流 引 擎 等 多 个 部 分 ， 尽 管 目 前 业务 流程 管理 开发 商都 已 经 认识 到 以 SaaS 模式 交付 流程 
系统 带 来 的 好 处 ， 但 对 于 流程 系统 中 哪些 部 分 应 该 以 SaaS 交付 并 没 形成 一 致 。 对 不 同 厂商 
而 言 ，SaaS 业务 流程 管理 的 内 涵 并 不 一 样 。 因 此 ， 本 文 也 不 打算 给 出 一 个 明确 的 定义 。 但 
从 总 体 上 看 , 目前 国外 厂商 的 Saas 服务 以 提供 流程 和 业务 规则 建 模 为 主 , 如 IBM (Lombardi 
Blueprint 和 Blueworks )，Software AG Alignspace; 有 少数 厂商 具有 以 SaaS 提供 流程 执行 环 


3 Business Process Execution Language， 业 务 流程 执行 语言 。 一 种 基于 XML 的 , 用 来 描写 业务 过 程 的 编程 语 


瑟 
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境 的 能 力 ， 如 Appian, Cordys(Cordys Business Operations Platform 和 Vitria; 只 有 极 少 数 厂 
商 能 够 同时 以 Saas 提供 流程 建 模 和 运行 环境 ， 如 PegaSystems” 和 Adeptia BPM5。 这 些 厂 商 
采取 的 租赁 模型 也 不 尽 相 同 , 如 Adeptia BPM 采取 的 是 单独 租赁 模式 ， 即 为 每 个 租户 提供 一 
个 或 若干 虚拟 机 来 部 署 其 业务 流程 管理 实例 ， 而 IBM 则 采用 共享 应 用 实例 的 模式 。 


2.2 用 户 端 与 云端 的 业务 数据 联动 


正如 在 第 一 节 中 所 论述 的 ， 实际 应 用 中 ， 脱 离 用 户 端 的 “ 纯 ” 云 工作 流 是 不 现实 的 。 因 为 
用 户 端 往 往 具 有 满足 特定 需求 的 业务 系统 , 即使 只 是 一 般 的 办 公 软 件 ， 其 中 也 会 维护 着 重要 
的 业务 数据 ,为 了 实现 用 户 端 与 云端 业务 数据 的 实时 联动 ,我 们 调研 了 数据 同步 的 相关 技术 ， 
尤其 是 云 计算 环境 下 的 数据 同步 技术 。 


数据 同步 技术 是 一 个 经 典 的 问题 ， 早 在 1996 年 特 里 戈 尔 (A. Tridgell) 和 马克 拉 斯 〈 了 . 

Mackerras) 就 提出 了 rsync 算法 中 。 该 算法 采用 了 增 量 同步 的 技术 ,已 经 被 广泛 用 于 各 Unix 

发 行 版 。 随 着 分 布 式 文件 系统 的 成 熟 和 云 存 储 服务 的 出 现 ， 有 一 些 利用 云 计算 环境 来 实现 数 

据 同 步 的 研究 开始 出 现 。 澳 大 利 亚 墨 尔 本 大 学 的 布 罗 伯 格 (J. Broberg，) 等 人 开发 了 Cloud 

和 Storage MashupH0， 可 以 集成 Amazon S3、Nirvanix 等 云 存 储 服务 ， 实 现 高 性 能 、 低 花费 的 

> 数据 分 发 和 同步 ,国防 科大 茅 华 建 (音译 ，Huajian Mao)、 美 国 韦 恩 州立 大 学 施 园 松 (Weisong 

st Shi) 等 人 开发 一 款 名 为 WuKongt 的 面向 云 的 数据 服务 , 可 以 借助 云 实现 PC 以 及 其 他 手持 
CN 设备 的 实时 同步 ， 其 特点 在 于 提供 了 一 个 抽象 层 ， 透 明 地 集成 各 种 云 存储 服务 。 


数据 同步 技术 的 研究 由 来 已 久 , 在 云 存储 逐渐 发 展 起 来 之 后 为 这 一 技术 的 进化 提供 了 新 
0 的 可 能 。 当 前 已 经 出 现 了 一 些 利用 云 存储 实现 数据 同步 的 研究 工作 , 但 是 主要 还 是 通过 接 
区 集成 ， 缺 少 在 新 的 背景 下 的 算法 创新 。 


2.3 工作 流 数据 管理 的 可 扩展 性 


全 基于 云 的 工作 流 面 向 互联 网 范围 提供 服务 , 因此 其 处 理 的 流程 请 求 的 密集 程度 、 数 据 的 

,一 规模 都 远 远 高 于 传统 的 工作 流 系统 。 在 请 求 密集 、 数 据 量 大 的 场景 中 ， 流 程 数据 的 读 写 往往 

PN 成 为 系统 的 瓶颈 。 随 着 类 Google BigTablei 的 一 些 分 布 式 数据 存储 系统 的 出 现 ， 一 些 研 究 
者 开始 考虑 使 用 开源 分 布 式 数据 存储 系统 如 HBaset™ 等 来 增强 流程 管理 系统 的 可 扩展 性 。 


美国 加 州 大 学 的 王建 武 (Jianwu Wang) 等 人 研究 了 将 科学 工作 流 软件 Kepler 与 Hadoop 
集成 ， 减 少 了 有 关 流 程 数据 处 理 的 时 间 且 改善 了 Map-Reduce 的 易 用 性 中。 加 拿 大 滑铁卢 大 
学 的 章 陈 〈 音 译 ，Chen Zhang) 等 人 在 Hadoop 的 基础 之 上 开发 了 一 款 轻 量 级 流程 管理 软件 
CloudWF55 ， 使 用 HBase 来 存储 流程 变量 ， 使 用 HDFS 存储 业务 文档 ， 使 得 系统 具有 高 可 
扩展 性 。 美国 德州 大 学 的 阿布 拉 罕 (J. Abraham) 等 人 采用 了 HBase 来 存储 服务 输出 的 RDF” 
数据 ， 并 且 优 化 了 HBase 的 存储 结构 以 提升 SPARQL 语言 的 查询 效率 5 。 


然而 , 目前 的 工作 流 数 据 的 可 扩展 管理 机 制 研究 主要 集中 在 科学 工作 流 领域 , 还 缺少 通 
用 工作 流 系统 的 数据 扩展 方案 , 而 通用 工作 流 系 统 对 于 数据 一 致 性 、 可 定制 的 查询 要 求 更 高 。 


3 ”关键 问题 


4Appian:http://www.appian.com/registerUserWebinarBpmit.do 
SpegaSystems: http://www.pega.com 
5Adeptia BPM:http:/www.adeptiabpm.com/?gclid=CIewp5ep0aQCFc8EHAodz2P_LA 


”Resource Description Framework， 资 源 描述 框架 
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基于 云 计算 环境 的 、 可 租用 的 SaaS 流程 系统 使 用 模式 与 以 往 相 比 ， 发 生 了 很 大 变化 : 
由 以 往 的 一 家 独 享 变 为 多 家 共享 ; 流程 系统 不 再 部 署 在 企业 内 部 , 而 是 部 署 在 第 三 方 运营 中 
心 ; 系统 的 用 户 数 和 数据 量 由 可 预测 变 成 难以 预测 ;服务 质量 保障 不 再 是 自己 说 了 算 ， 而 是 
受到 服务 等 级 协议 的 约束 。 这 一 系列 的 变化 , 对 于 如 何在 行业 云 中 心 提供 可 用 的 流程 服务 带 
来 了 很 多 技术 上 的 挑战 。 这 包括 : 如 何 为 用 户 提 供 基于 浏览 器 的 流程 建 模 工具 ， 以 便 支 持 多 
用 户 协 同 建 模 ; 如 何 保证 用 户 数据 不 被 其 他 租户 偷 血 和 窃取 ; 如 何在 某 些 服务 器 出 故障 的 情 
况 下 仍 能 保障 租户 业务 的 可 持续 性 ; 如 何 提 高 系统 的 可 伸缩 性 ,以 便 满足 持续 用 户 和 数据 的 
持续 增长 ; 如 何 支 持 用 户 本 地 业务 系统 与 云端 流程 系统 的 集成 ; 如 何 支 持 云 环境 下 跨 组 织 的 
业务 协同 。 这 些 问题 有 些 在 相关 工作 中 得 到 解决 , 但 有 些 仍然 没有 找到 好 的 解决 方案 。 限 于 
篇 幅 , 这 里 只 选择 了 与 本 文 主题 密切 相关 的 两 个 问题 进行 讨论 ， 以 部 分 说 明 VINCA ProFlow 
的 研发 动机 。 


3.1 流程 系统 中 的 数据 管理 
SaaS 流程 系统 中 的 数据 管理 与 传统 流程 系统 中 数据 管理 的 区 别 主要 体现 为 三 个 方面 : 


1. 数据 隔离 存储 传统 流程 系统 中 的 数据 存放 在 企业 自身 服务 器 ， 不 暴露 在 公共 的 互联 网 
上 ， 不 必 过 多 担心 其 安全 性 。 但 在 SaaS 模式 的 流程 系统 中 ， 为 了 避免 业务 数据 外 沪 ， 
用 户 希 望 其 流程 数据 与 其 他 用 户 数据 的 隔离 有 可 靠 保 证 。 


2. 用户 端 与 云端 数据 联动 : 由 于 跨 管理 域 的 特点 ， 基 于 云 计 算 环境 的 工作 流 需 要 处 理 的 
业务 数据 可 能 分 布 在 不 同 的 自治 域 中 。 流 程 引擎 要 访问 用 户 端的 业务 数据 有 两 种 方案 : 
一 种 是 用 户 端 将 业务 数据 封装 为 服务 供 云端 调用 ， 但 这 对 于 用 户 端的 IT 建设 水 平 要 求 
较 高 ， 且 容易 形成 单 点 依赖 ， 甚 至 造成 Slashdot 效应 8， 另 一 种 方案 是 通过 数据 同步 
技术 实现 用 户 端 和 云端 业务 数据 的 联动 , 将 用 户 要 共享 的 业务 数据 实时 汇聚 到 云端 , 供 
流程 引擎 及 流程 参与 者 访问 。 其 中 的 技术 难点 就 是 如 何 保持 云 中 的 数据 是 相对 “新 鲜 ” 
的 。 


3. 数据 管理 的 动态 扩展 : 工作 流 系统 提供 的 是 一 种 有 状态 的 服务 ， 对 业务 流程 的 状态 的 
管理 依赖 于 工作 流 数 据 的 管理 , 频繁 的 状态 变迁 将 引起 工作 流 数据 的 密集 读 写 。 传统 工 


作 流 多 采用 关系 数据 库 管 理工 作 流 数据 ,这 种 集中 式 的 数据 管理 方式 能 够 满足 单个 企业 
< 或 组 织 内 部 流程 管理 的 需要 。 然而 , 基于 云 计算 环 境 的 工作 流 系统 要 面向 整个 互联 网 提 
9 供 服 务 , 传统 的 流程 数据 管理 方式 已 经 难以 适应 数据 管理 的 高 可 扩展 、 高 并 发 读 写 等 需 


求 ， 虽 然 目前 已 经 有 了 诸如 BigTable02, Amazon S3, HBase03l 等 基于 云 计算 环境 的 数据 
管理 软件 ,但 是 这 些 软件 提供 的 数据 查询 服务 还 较为 单一 ， 以 键 值 查询 为 主 ， 能 否 满足 
流程 系统 中 数据 管理 需求 还 有 等 进一步 的 研究 。 


3.2 可 伸缩 、 高 可 靠 的 流程 运营 支撑 


SaaS 系统 共有 用 户 量 大 、 用 户 数 量 持续 增长 、 用 户 访问 时 段 共 有 周期 性 和 “扎堆 ”的 特 
点 , 这 对 流程 应 用 的 运行 支撑 提出 了 很 高 的 要 求 ,系统 必须 能 够 在 用 户 请 求 集中 时 提供 更 多 
处 理 能 力 以 避免 响应 时 间 的 明显 增加 , 并 在 用 户 请 求 降低 时 去 掉 一 些 处 理 能 力 以 节省 运营 成 
本 。 此 外 ， 在 关键 性 的 业务 应 用 中 ， 在 流程 执行 过 程 中 业务 流程 引擎 出 现 异常 或 宕 机 时 ， 应 
该 提供 相应 的 异常 处 理 机 制 , 比如 将 异常 引擎 中 的 流程 实例 转移 到 健康 的 流程 引擎 上 继续 执 
行 ， 使 用 户 的 业务 能 够 顺畅 地 进行 。 因 此 ， 作 为 一 种 可 持续 运营 的 流程 SaaS 系统 ， 必 须 考 


~ 


?Slashdot 是 一 个 网 站 , 每 天 都 会 更 新 在 主页 的 新 闻 数 次 。 较 受 欢 迎 的 新 闻 可 能 会 有 上 千 的 浏览 者 发 表意 见 。 
Slashdot 效应 是 指 当成 千 上 万 的 读者 连结 到 某 一 在 Slashdot 公布 的 网 址 时 ， 导 致 该 网 址 因 访 问 人 数 激增 而 
瘫痪 的 效应 。 
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虑 到 运营 期 间 系 统 用 户 和 数据 规模 的 持续 增长 , 并 且 必 须 为 用 户 业 务 的 可 持续 性 提供 有 力 保 
障 。 为 此 ， 需 要 提供 一 个 可 伸缩 、 高 可 靠 的 流程 运行 环境 。 


4 VINCA ProFlow 


4.1 目标 


基于 以 上 分 析 ，VINCA ProFlow 的 设计 宗旨 是 针对 中 小 组 织 机 构 自身 开设 施 落后 的 现 
状 ， 为 中 小 型 组 织 机 构 提供 一 种 可 按 需 租 用 的 流程 服务 (BPM-as-a- Service)。 具 体 目 标 为 : 


1. 文 持 数据 独 享 租赁 模型 : 各 个 租户 在 共享 同一 流程 服务 实例 的 同时 ， 又 可 专 享 独立 的 数 
据 空 间 ， 保 证 租户 间 数 据 的 有 效 隔离 ， 保 护 租户 隐私 。 


2. 可 扩展 的 数据 管理 ， 当 VINCA ProFlow 现 有 的 硬件 资源 不 足以 存储 流程 数据 或 文 撑 高 
并 发 的 流程 数据 访问 时 ,可 以 通过 增加 新 的 服务 器 来 分 担 存储 和 数据 访问 的 压力 。 这 一 
过 程 对 流程 引擎 应 该 是 透明 的 、 平 消 的 ， 不 需要 修改 代码 或 停止 正在 运行 的 流程 实例 。 


> 3.， 支持 用 户 端 业务 系统 与 云端 应 用 的 数据 集成 : 为 使 中 小 组 织 机 构 托管 在 云端 的 业务 流 各 
©O 能 够 使 用 到 组 织 机 构 在 本 地 的 “最 鲜 活 "的 业务 数据 , 需要 将 本 地 业务 数据 的 任何 微小 变 
动 实时 同步 到 云端 业务 数据 空间 ， 供 业务 流程 执行 时 使 用 。 


4. 提供 可 靠 、 可 伸缩 的 流程 运行 环境 : 可 靠 是 指 在 引擎 服务 器 出 现 故障 时 系统 能 够 将 故障 
ev 服务 器 上 的 流程 实例 在 较 短 的 时 间 内 迁移 到 正常 服务 器 上 继续 执行 , 从 而 保证 用 户 业 务 
© 的 可 持续 性 ; 可 伸缩 是 指 当 用 户 并 发 访问 密集 时 ， 可 以 动态 增加 引擎 服务 器 ， 从 而 水 平 
扩展 系统 处 理 能 力 。 而 当 用 户 访问 量 下 降 时 ， 又 可 以 逐步 减少 引擎 服务 器 数量 ， 以 降低 
成 本 。 


4.2 关键 技术 


系统 控制 台 


租户 管理 
虚拟 机 管理 


群 
时- 
引擎 租户 元 数据 


数据 库 集 群 数据 缓存 集群 ey 

缓存 | 缓存 pg 
| 
租户 数据 租户 数据 缓存 | 数据 库 


图 1。VINCA ProFlow 的 组 成 


为 了 实现 上 述 目标 , 本 文 在 前 期 工作 的 基础 上 做 了 两 方面 工作 : 首先 ,在 VINCA ProFlow 
的 体系 结构 中 引入 了 多 租户 共享 实例 、 独 享 数据 空间 的 SaaS 租赁 模型 ， 实 现 了 租户 间 组 织 
机 构 数据 、 流 程 模型 数据 、 流 程 运行 时 数据 以 及 个 性 化 配置 数据 的 隔离 存储 ， 能 够 避免 租户 
数据 的 被 偷 筑 和 和 窍 取 ; 其 次 , 通过 引入 虚拟 机 管理 、 引 擎 集群 管理 和 调度 、 数 据 管理 等 机 制 ， 
提供 了 一 个 可 动态 伸缩 、 可 靠 的 业务 流程 执行 环境 ， 能够 应 对 用 户 请 求 和 数据 的 不 断 增长 和 
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让 


剧变 化 ， 如 图 1 所 示 。 限 于 篇 幅 ， 本 文 仅 选 其 中 最 相关 的 几 项 关键 技术 进行 汇报 。 
1. 支持 多 租户 的 、 可 扩展 的 数据 管理 技术 


为 了 达到 84.1 中 提 到 的 前 三 个 目标 ， 在 VINCA ProFlow 研发 过 程 中 ， 集 中 开展 了 面向 
多 租户 的 数据 管理 动态 扩展 技术 。 该 技术 从 如 下 三 个 方面 取得 了 一 定 进展 。 


- ”基于 虚拟 数据 服务 的 多 租户 数据 隔离 


在 多 租户 的 架构 下 ,如 何 保障 租户 的 数据 隔离 是 一 个 具有 两 方面 困难 的 难题 。 一 方面 是 
数据 的 访问 权限 的 隔离 , 即 租户 在 未 经 授权 的 情况 下 不 能 访问 彼此 的 数据 ,以免 泄漏 数据 隐 
私 ; 另 一 方面 是 数据 访问 的 服务 质量 的 隔离 ， 即 当 一 个 租户 提交 一 个 慢 查询 后 ， 其 他 租户 的 
数据 访问 请 求 不 会 因为 数据 库 服务 器 太 忙 而 被 延 时 或 拒绝 ,虚拟 机 技术 是 实现 资源 隔离 的 有 
效 方法 ，VINCA ProFlow 通过 Xen' 把 安装 有 关系 数据 库 、 键 值 数据 存储 系统 的 操作 系统 封 
装 成 虚拟 机 镜像 ， 在 每 个 虚拟 机 实例 上 ， 在 不 同 的 端口 运行 着 多 个 数据 服务 进程 ， 每 个 租户 
独占 自己 的 数据 服务 进程 -VINCA ProFlow 在 创建 租户 时 能 够 为 其 自动 创建 其 应 用 需要 的 虚 
拟 数据 服务 ， 用 来 保存 其 流程 数据 、 组 织 机 构 以 及 个 性 化 配置 数据 ， 实 现 了 租户 间 的 数据 隔 
~ 离 ， 而 且 可 以 通过 图 形 化 的 监控 仪表 面板 查看 系统 中 各 租户 对 配额 的 使 用 情况 。 


- “基于 数据 分 片 的 用 户 端 -云端 业务 数据 联动 


在 实现 用 户 端 业务 系统 与 云端 系统 集成 时 ， 最 关键 的 是 实现 本 地 数据 与 云端 数据 的 联 
动 。 在 实际 应 用 中 ,业务 数据 的 变更 往往 体现 出 局 部 性 特征 ,用 户 端 更 新 的 数据 与 云端 的 数 
据 副 本 只 存在 部 分 差异 。 为 此 ， 本 文 提 出 了 一 种 基于 数据 分 片 的 用 户 端 -云端 业务 数据 联动 
机 制 ， 则 在 快速 识别 出 数据 差异 , 减少 数据 流量 ， 从 而 提高 业务 数据 联动 的 实时 性 。 其 工作 


原理 是 : 


在 用 户 端 部 署 代理 程序 ， 通 过 注册 文件 系统 钩子 (hook) 以 及 监视 数据 库 日 志 等 手段 实 
现 事 件 驱 动 的 数据 变化 监测 机 制 。 代 理 程 序 负责 根据 业务 数据 类 型 将 其 划分 为 一 定 粒度 的 片 
段 ， 并 计算 每 个 片段 的 特征 值 。 对 于 纯 文本 的 文档 数据 ， 以 一 定 的 行 数 为 分 片 的 单位 ， 对 于 
二 进 制 格式 的 文档 数据 ， 以 一 定 长 度 的 字 节 窗口 为 分 片 的 单位 ; 对 于 关系 型 数据 库 管理 系统 
中 的 数据 ， 以 一 定 行 数 的 元 组 窗口 为 分 片 的 单位 。 数据 特征 值 的 计算 可 采用 弱 校 验 和 强 校 验 
结合 的 算法 。 当 用 户 端 数据 被 修改 后 ,用户 端 代理 将 业务 数据 的 特征 值 传输 到 云端 ， 云 端 通 
过 比 对 找 出 缺少 的 数据 片段 的 特征 值 ， 并 将 这 些 特征 值 返回 给 用 户 端 的 代理 。 然后， 用户 端 
代理 将 云端 缺少 的 数据 片段 压缩 后 发 送 到 云端 ， 云 端 将 这 些 数据 解压 后 归并 到 相应 的 位 置 。 


- ”基于 特征 的 流程 数据 的 可 扩展 管理 


传统 业务 流程 系统 一 般 采 用 关系 型 数据 库 管理 流程 数据 ,但 是 采用 关系 型 数据 库存 储 流 
程 数据 在 可 扩展 性 上 存在 局 限 。 关 系 型 数据 库 的 经 典 可 扩展 方案 主要 有 两 种 : 读 写 分 离 0 
和 数据 分 片 ( 站 。 读 写 分 离 适 合 读 多 写 少 的 应 用 ， 在 数据 更 新 频繁 的 环境 下 数据 延迟 的 情况 
会 很 严重 ; 数据 分 片 技术 虽然 提高 了 可 扩展 性 , 但 是 牺牲 了 关系 数据 库 的 事务 保障 、 复 杂 查 
询 等 功能 。 近 年 来 在 互联 网 计算 领域 出 现 的 分 布 式 键 值 存储 系统 (如 BigTablet 1、Dynamo、 
Cassandrat 等 ) 在 基于 键 的 读 写 性 能 上 做 了 特殊 优化 ， 且 能 够 通过 对 等 网 络 (P2P) 协议 将 
数据 在 多 台 服 务 器 上 进行 划分 和 复制 , 使 得 系统 的 水 平 扩 展 能 力 增强 。 我们 考虑 结合 各 种 不 
同 的 数据 管理 工具 的 优势 来 进行 流程 数据 的 管理 。 通过 初步 的 实验 , 我 们 观察 到 流程 数据 具 
有 不 同 的 访问 特征 ， 如 表 2 所 示 。 元 数据 的 读 取 操作 多 于 写 入 操作 ， 查 询 语句 复杂 度 不 高 。 


9 一 个 由 剑桥 大 学 开发 的 开放 源 代码 虚拟 机 监视 器 。 
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列 如 : 获取 流程 的 定义 ， 查 询 菜 个 机 构 下 的 用 户 ; 实例 数据 的 读 写 操作 比例 相当 ， 读 写 都 很 
频繁 ， 查 询 语句 较 简 单 ， 主 要 以 单 键 查询 为 主 ， 例 如 : 根据 流程 实例 的 ID 更 改 它 的 状态 、 
民 据 流程 变量 的 ID 更 新 其 值 等 ， 日 志 数 据 的 写 入 操作 多 于 读 取 操 作 ， 但 查询 语句 较 复杂 ， 
且 多 为 统计 类 查询 语句 ， 例 如 : 查询 一 段 时 间 内 执行 耗 时 最 多 的 10 个 活动 。 


经 过 对 这 些 特征 的 分 析 和 总 结 ，VINCA 
ProFlow 提出 一 种 基于 特征 的 流程 数据 可 扩展 管 -一 一 
理 机 制 ,其 思想 是 针对 各 类 流程 数据 的 特征 采用 数据 类 型 ” 读 写 特征 。 查询 复杂 
不 同 的 数据 存储 方式 , 综合 集成 关系 型 数据 库 和 数据 。 次 多 号 少 。 复杂 碍 淘 较 多 
分 布 式 键 值 存储 系统 来 解决 工作 流 内 部 数据 的 ”实例 数据 读 与 频繁 党 刍 合 询 为 主 
可 扩展 性 方面 的 问题 。 将 关系 型 数据 库 用 于 元 数 -日志 数据 _ 读 与 可 并 步 复杂 合 询 较 多 _ 
据 的 存储 ， 分 布 式 键 值 存储 系统 Cassandra 用 于 存储 运行 时 的 流程 实例 数据 ， 利 用 分 布 式 键 
值 存储 系统 的 可 扩展 性 来 增强 工作 流 运行 时 的 可 扩展 性 。 此外, 通过 抽象 的 流程 数据 访问 层 
(Process Data Access Layer, PDAL) 为 工作 流 引擎 屏蔽 了 底层 数据 模型 的 差异 ， 并 在 内 部 完成 
了 对 流程 数据 的 适 配 和 路 由 ， 也 使 得 引擎 的 数据 访问 代码 不 需要 随 着 节点 个 数 的 伸缩 而 修 
和 于 二 改 。 


2. 引擎 集群 管理 和 调度 技术 


为 了 实现 S4.1 中 目标 4 提出 的 可 伸缩 性 ，VINCA ProFlow 采用 了 分 布 式 多 引擎 的 架构 。 
底层 数据 一 致 性 由 流程 数据 访问 层 提供 。 元 引擎 负载 对 多 个 流程 执行 引擎 的 调度 和 管理 。 流 
程 执行 引擎 的 数量 初始 为 1-2 个 ， 当 系统 负载 较 大 时 ,管理 员 可 以 通过 系统 管理 控制 台 将 相 
对 空 亲 的 流程 执行 引擎 加 入 集群 ,分担 系统 的 负载 。 当 没有 足够 可 用 的 流程 执行 引擎 时 ， 管 
理 员 可 以 激活 安装 有 流程 执行 引擎 的 虚拟 机 镜像 的 实例 , 实现 快速 扩容 。 引擎 集群 的 调度 原 
理 为 : 当 元 引擎 接受 到 前 端的 工作 流 门户 发 出 的 请 求 后 ,根据 其 请 求 的 应 用 ,通过 一 级 调度 
器 的 决策 , 选择 一 个 流程 执行 引擎 来 执行 其 请 求 的 流程 。 元 引擎 会 记录 每 次 流程 请 求 的 响应 
时 间 ， 然 后 周期 性 地 调整 各 个 流程 的 权重 策略 。 此 外 ， 由 于 流程 中 不 仅 包含 本 地 服务 调用 ， 
还 有 远程 服务 调用 ,有 时 一 个 远程 服务 调用 活动 可 以 由 多 个 节点 提供 , 故 每 一 个 流程 执行 引 
擎 有 独立 的 二 级 调度 器 ， 用 于 调度 应 用 执行 过 程 中 的 服务 调用 活动 。 


表 2. 流程 数据 的 访问 特征 


束 


LU 


荆 


荆 
< 


< 


= ~ ”基于 流程 相似 度 的 权重 预 设 
ed 为 了 减少 与 新 部 署 的 流程 对 应 的 权重 策略 的 权 值 收敛 过 程 所 需要 的 时 间 , 我 们 提出 一 种 


基于 流程 相似 度 的 权重 预 设 算法 。 如果 现 有 的 系统 中 没有 部 署 任何 流程 , 那么 新 部 署 的 流程 
对 应 的 各 引擎 分 配 权重 设置 为 均等 ; 如 果 现 有 的 系统 已 部 署 了 一 定量 的 流程 ， 且 经 过 一 段 时 
间 的 运行 它们 的 权重 策略 已 经 收敛 到 一 个 稳定 的 状态 , 那么 新 部 署 的 流程 的 权重 策略 的 初始 
值 就 可 以 根据 和 它 相 似 的 其 他 流程 的 权重 值 计 算出 来 。 


- ”基于 流程 特征 的 动态 加 权 轮 转 


一 般 常 用 的 调度 算法 有 : 简单 轮转 法 、 静 态 加 权 轮 转 法 、 基 于 请 求 数量 的 加 权 最 小 连接 
数 优先 法 、 以 及 动态 加 权 轮 转 法 等 。 结 合 VINCA ProFlow 自身 的 业务 特点 ， 我 们 提出 一 种 
基于 流程 特征 的 动态 加 权 轮 转 法 。 传 统 的 动态 加 权 轮 转 法 对 所 有 的 请 求 采 取 统 一 的 权重 策 
略 ， 而 VINCA ProFlow 采用 的 算法 则 是 针对 不 同 的 业务 流程 使 用 响应 采用 不 同 的 权重 策略 ， 
不 同 的 流程 执行 中 对 资源 的 消耗 情况 是 不 一 样 的 ,有 的 流程 是 计算 密集 型 ， 有 的 是 IO 密集 
型 ， 各 流程 执行 引擎 所 在 节点 的 计算 能 力 、1/O 吞吐 能 力 和 操作 系统 也 不 尽 相同 ,因此 需要 为 
每 种 类 型 的 流程 维护 合适 的 权重 策略 。 
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- ， 两 级 调度 机 制 


由 于 流程 调用 的 服务 中 有 一 些 是 本 地 服务 , 有 一 些 则 是 其 他 节点 上 的 服务 ， 且 同一 功能 
的 服务 可 能 在 不 同 的 节点 上 有 副本 ， 当 流程 运行 过 程 遇 到 这 种 情况 时 ， 就 需要 选择 由 哪 一 个 
节点 来 执行 该 服务 。 由 于 各 个 节点 的 软 硬 件 资源 的 差异 以 及 通信 速度 的 差异 ,服务 调用 的 响 
应 时 间 也 会 有 差异 。 因 此 ,为 了 优化 服务 调用 的 响应 时 间 ，VINCA ProFlow 设计 了 服务 二 级 
调度 机 制 ， 即 除了 元 引擎 有 针对 应 用 的 一 级 调度 器 , 每 个 引擎 还 维护 一 个 针对 服务 调用 的 二 
级 调度 器 。 该 调度 器 将 远程 服务 调用 活动 的 请 求 按 一 定 的 权重 分 配给 部 署 了 该 服务 副本 的 节 
点 。 


3. 引擎 失效 检测 及 流程 实例 迁移 技术 
要 实现 可 靠 的 流程 执行 环境 需要 解决 如 下 几 个 重要 问题 


一 准确 及 时 地 发 现 失效 引擎 ， 并 迅速 迁移 和 恢复 失效 引擎 中 未 完成 的 流程 ; 
引擎 间 共 享 流 程 执行 信息 ,以 便 在 某 一 引擎 失效 时 , 其 它 引 擎 能 够 获取 失效 引擎 中 
未 执行 完成 流程 的 信息 ; 

一 ”选择 合适 的 流程 恢复 起 点 ， 避 人 免 重复 执行 已 完成 的 部 分 。 


针对 上 述 问题 , 我们 对 流程 引擎 失效 检测 及 实例 迁移 技术 进行 了 研究 , 在 引擎 集群 和 元 
引擎 管理 的 基础 上 做 了 三 方面 工作 : 


- 扩充 了 WMFC (the Workflow Management Coalition， 工 作 流 管理 联盟 ) 规范 中 的 
流程 活动 运行 时 模型 ， 以 更 细 粒 度 描述 了 流程 活动 的 执行 过 程 ; 

一 ”采用 分 布 式 缓存 的 方法 实现 流程 信息 在 引擎 集群 中 的 共享 。 当 出 现 引 擎 失效 时 , 其 
它 引擎 可 以 从 缓存 服务 器 中 读 取 失效 引擎 中 未 完成 流程 的 信息 ， 并 进行 恢复 ; 

一 ”采用 组 播 技 术 检测 引擎 是 否 失效 。 当 元 引擎 检测 到 失效 引擎 时 , 及 时 将 失效 引擎 中 
的 未 完成 流程 实例 迁移 到 健康 引擎 中 并 回复 执行 。 


5 “评价 和 验证 
5.1 扩展 性 评价 


为 了 验证 VINCA ProFlow 的 扩展 性 ， 本 文 使 用 JMeter、Apache Benchmark 等 工具 模拟 
高 并 发 的 流程 请 求 场景 ,对 该 系统 在 不 同 部 署 模 式 下 的 吞吐 率 〈 单 位 时 间 内 处 理 流程 请 求 的 
个 数 ) 变化 情况 进行 评价 。 


本 文采 用 的 测试 案例 流程 请 求 总 计 为 100000 个 ， 并 发 度 为 1000。 测 试 使 用 的 流程 是 一 
个 无 人 工 参与 的 流程 , 包括 了 顺序 、 分 支 、 循环 等 基本 风 辑 结构 , 流程 中 的 活动 为 脚本 活动 ， 
以 避免 调用 Web Service 引入 外 部 系统 的 性 能 干扰 。 系 统 部 署 模式 分 别 为 : (1) 一 个 引擎 配 
一 个 数据 节点 ;2) 保持 一 个 数据 节点 不 变 ， 动态 增加 流程 引擎 的 数量 ;(3) 同时 动态 增加 
流程 引擎 和 数据 节点 的 数量 。 

测试 结果 表明 :在 部 署 模 式 (1〉 中， 由 于 单 流程 引擎 和 单数 据 节 点 受到 单机 物理 性 能 
的 局 限 ， 其 吞吐 率 达 到 一 定 程度 后 很 难 再 进一步 提升 ， 在 部 署 模式 〈2) 中 ， 通 过 增加 流程 
引擎 的 数量 ， 可 以 进一步 提升 系统 吞吐 率 ,但 最 终 仍 会 受到 数据 节点 处 理 能 力 的 限制 ;在 部 
署 模式 〈3)， 可 以 通过 同时 增加 引擎 节点 和 数据 节点 实现 吞吐 能 力 的 不 断 扩 展 。 


5.2 可 靠 性 评价 


~ 
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E， 我 们 首先 启动 两 个 引擎 ， 然 后 关闭 其 中 一 个 引擎 ， 


观察 运行 在 被 关闭 引擎 中 的 流程 实例 是 否 被 成 功 迁移 到 另 一 个 引擎 中 并 恢复 执行 。 如 网 2 


所 示 ， 测 试 前 系统 中 有 两 个 健康 引 


擎 ，IP 为 10.61.1.134 的 引擎 中 有 5 个 了 


IP 为 10.61.0.111 的 引擎 中 有 1 个 正在 执行 的 流程 。 


测试 时 ， 强 制 关 闭 IP 为 10.61.0.111 的 引擎 。 如 图 3 所 示 ， 被 关闭 引擎 中 的 1 个 流程 被 


迁移 到 IP 为 10.61.1.134 的 引擎 中 继续 执行 。 


10.61.1.134:8080 


Process ID 


Process Name 


8abd81062b132cd9012b13ebc8 co_zhuanzhenshenaing_128452: 


sabd80ef2b0f64d4012b0f689d1 referral_1284453732896 


8abd81062b0f63e301 
8abd81062b0f889801 


8abd80ef2b1842ee01 


10.61.1.134:8080 


Process ID 


8abd81062b132cd90 


8abd80ef2b0f64d401 


2b0f68c60 referral_1284453745236 
2b0f8a21t referral_1284455931283 


2b185f0b1 referral_1284604097698 


图 2， 集 群 中 所 有 健康 引擎 的 流程 信息 列表 


12bl13ebc8760ce6 


2b0f689d1le026f 


8abd81062b0f63e3012b0f68c60301c2 


8abd80ef2b1842ee012b185f0b140021 
8abd80ef2b19519c012b1953f9780008 


10.61.0.111:9080 


Process ID Process Name 


Sabd80ef2b19519c012b1953f97 referral_1284620149387 


Process Name 
co_zhuanzhenshenqing_1284529439270 
referral_1284453732896 
referral_1284453745236 
referral_1284455931283 
referral_1284604097698 
referral_1284620149387 


FE 在 执行 的 流程 ， 


6 ”结束语 


图 3， 关 掉 一 个 引擎 后 ， 健 康 引 擎 的 流程 信息 列表 


VINCA ProFlow 作为 VINCA TARC 的 组 成 部 分 之 一 ， 目 标 是 提供 


业务 流程 系统 。 本文 首先 基于 
析 了 在 VINCA TARC 中 提供 流程 服务 能 力 的 必要 性 ， 然 后 讨论 了 国内 外 相关 


小 企业 对 业务 流程 管理 


种 可 租用 的 SaaS 
E 的 需求 与 其 投入 能 力 之 间 的 矛盾 , 分 


[ 作 进 展 ， 并 


分 析 了 以 Saas 模式 交付 业务 流程 系统 时 蝇 待 解决 的 关键 问题 ， 最 后 讨论 了 中 科 院 计算 所 自 
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